法國Mistral AI推出Mistral3系列模型,包括3B、8B、14B三個小型密集模型及最強的Mistral Large3,覆蓋邊緣設備到企業級推理全場景。新模型沿用Apache2.0開源協議,權重已上傳至Hugging Face與GitHub,允許商業免費使用。該系列在保持低延遲優勢的同時,將上下文長度擴展至128K,並在主流基準測試中與Llama3.1同規格模型表現相當。
最新研究對12款主流大模型進行高壓測試,發現當面臨截止日期縮短、懲罰加重等壓力時,模型表現顯著下降。例如Gemini2.5Pro失敗率從18.6%飆升至79%,GPT-4o也接近腰斬。在生物安全等關鍵任務中,模型甚至出現跳過關鍵步驟的嚴重失誤。
SemiAnalysis報告指出,OpenAI自2024年5月發佈GPT-4o後,未完成新一代前沿模型的大規模預訓練,因擴展參數和數據時遭遇收斂困難或性能倒退而中止。GPT-5系列實爲GPT-4o優化版,缺乏架構突破。相比之下,谷歌TPUv7已在Gemini3等模型上成功驗證大規模預訓練,算力集羣表現更優。
DeepSeek團隊發佈236B參數數學大模型DeepSeek-Math-V2,採用MoE架構,僅激活21B參數,支持128K上下文。該模型以Apache2.0開源,引發下載熱潮。在數學測試中表現優異:MATH基準達75.7%,接近GPT-4o;AIME2024解題30中4,超越Gemini和Claude;Math Odyssey獲53.7%成績。其核心技術爲“自驗證”機制。
聊天機器人AI產品集合,包括GPT-4o, Gemini, Qwen, Deepseek, Claude & Grok。
精選展示 OpenAI GPT-4o 生成的多樣化 AI 藝術圖像與提示。
開發者可互動體驗 OpenAI API 中的新語音模型gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。
百聆是一個類似GPT-4o的語音對話機器人,通過ASR+LLM+TTS實現,低配置也可運行,支持打斷。
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
-
Bytedance
$0.8
$2
128
$8.75
$70
400
$0.35
$1.75
$14
Alibaba
64
$1.8
$5.4
16
Tencent
32
$17.5
$56
$0.7
$2.4
$9.6
$525
$1050
Xai
$21
$105
Baidu
$1
$4
$420
200
Stepfun
$38
$120
Minimax
$8
$1.05
$4.2
unsloth
GLM-4-32B-0414是擁有320億參數的大語言模型,性能媲美GPT-4o和DeepSeek-V3,支持中文和英語,具備卓越的代碼生成、函數調用和複雜任務處理能力。
GLM-4-32B-0414是GLM家族的新成員,參數規模達320億,性能與GPT-4o、DeepSeek-V3等相當,支持本地部署。
zai-org
GLM-4-32B-Base-0414是GLM家族的新成員,擁有320億參數,在15T高質量數據上進行預訓練,性能可與GPT-4o和DeepSeek-V3等先進模型相媲美。該模型支持便捷的本地部署,在代碼生成、函數調用、搜索式問答等方面表現優異。
GLM-4-32B-0414是GLM家族的新成員,擁有320億參數的高性能大語言模型。該模型在15T高質量數據上進行預訓練,包含大量推理型合成數據,在代碼生成、函數調用、搜索問答等多個任務場景中表現出色,性能可與GPT-4o和DeepSeek-V3等更大規模模型相媲美。
Psychotherapy-LLM
該模型是基於Llama-3.1-8B-Instruct通過偏好學習微調的心理諮詢專用模型,在心理諮詢會話中表現優異,勝率超過GPT-4o。
AtlaAI
Atla Selene Mini 是當前最先進的小型評委語言模型(SLMJ),性能可媲美體積大10倍的模型,在多個基準測試中超越GPT-4o。
openbmb
MiniCPM-o 2.6是一款手機端運行的GPT-4o級多模態大模型,支持視覺、語音與直播流處理
VITA-MLLM
VITA-1.5是一個多模態交互模型,旨在實現GPT-4o級別的即時視覺與語音交互能力。
CISCai
這是Qwen2.5-Coder-32B-Instruct模型的GGUF量化版本,採用先進的重要性矩陣量化方法,在保證模型效果的同時顯著減少存儲和計算資源需求。該模型是當前最先進的開源代碼大語言模型,編碼能力與GPT-4o相當。
Sami92
基於XLM-R Large微調的文本分類模型,專門用於識別德語文本中的事實性聲明和非事實性聲明。模型採用弱監督學習方式,先在GPT-4o標註的Telegram數據集上訓練,後在手動標註數據集上繼續訓練,在測試集上達到0.9的準確率。
ruslandev
基於Meta-Llama-3-8B-Instruct微調的語言模型,通過GPT-4o提升數據質量,專注於俄語能力增強,在MT-Bench評估中俄語得分超過GPT-3.5-turbo。
一個基於FastAPI和GPT-4o的輕量級Excel自動化MCP服務器,支持通過自然語言操作Excel文件。
一個通過MCP協議直接查詢OpenAI模型的服務器,支持o3-mini和gpt-4o-mini模型,提供簡潔和詳細的回答。
MCP-ChatBot是一個基於模塊化能力協議(MCP)的聊天機器人應用,通過容器化架構集成天氣服務和GPT-4o模型,提供自然語言交互功能。
一個基於GPT-4o-mini模型的圖像分析MCP服務器,可處理URL或本地路徑的圖像內容分析
該項目是一個基於Model Context Protocol (MCP)的stdio服務器,用於將提示轉發至OpenAI的ChatGPT (GPT-4o),支持高級摘要、分析和推理功能,適用於LangGraph框架的助手集成。
一個基於OpenAI GPT-4o/gpt-image-1模型的圖像生成與編輯工具,支持通過文本提示生成圖像、編輯圖像(如修復、擴展、合成等),併兼容多種MCP客戶端。
一個通過MCP協議與ChatGPT交互的服務器,用於高級文本分析和推理。
一個基於Streamlit的智能聊天機器人,使用GPT-4o自動路由用戶請求到不同工具(如聊天、圖像生成、數據庫查詢、語音合成等),支持快速實驗AI工具路由功能。
MCP Server Whisper是一個基於OpenAI Whisper和GPT-4o模型的音頻處理服務器,提供高級音頻轉錄、格式轉換、批量處理和文本轉語音等功能,通過Model Context Protocol標準實現與AI助手的無縫交互。
一個基於GPT-4o-mini模型的圖像分析MCP服務器,通過接收圖片URL進行內容識別和描述